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Анализ применения унифицированных 
вычислителей в интеллектуальных системах 


Рассмотрены существующие на сегодняшний день высокопроизводительные присоединенные вычислители, 
позволяющие при умеренных затратах существенно ускорить решение задач искусственного интеллекта. 


Введение 


При создании современных интеллектуальных систем, требующих высокопро- 
изводительных расчетов, возникает проблема нехватки вычислительных ресурсов. 
Существующие суперкомпьютерные технологии остаются достаточно дорогостоящими 
решениями и не предоставляют возможности для действительно массового применения 
ресурсоемких интеллектуальных систем [1]. Получившие в последнее время широкое 
распространение вычислительные кластеры, несмотря на снижение стоимости и простоту 
реализации, тем не менее, не способны обеспечить требуемого уровня доступности и 
автономности. 

В этой связи представляет повышенный интерес получившее в последнее время 
широкое распространение альтернативное направление развития вычислительных 
средств, связанное с повышением производительности компьютеров широкого при- 
менения как стационарных, так и мобильных, путем дооснащения вычислительными 
устройствами унифицированного, стандартизованного исполнения. В литературе по- 
является, особенно в последнее время, множество публикаций по всевозможным 
сопроцессорам, акселераторам, ускорителям вычислений, характеризующихся высокой 
степенью универсальности, то есть не ориентированных на решение узкого класса 
специализированных задач. Однако эти сведения разрознены и отрывочны, не по- 
зволяют в полной мере оценить текущее состояние в этой области. 

В настоящей работе проанализирована информация по присоединенным вычисли- 
телям с целью оценки применимости для решения задач искусственного интеллекта. 


Унифицированные вычислители 


Использование специализированных вычислителей, или сопроцессоров, разра- 
ботанных для решения узкого класса задач, является известным решением, давно 
применяющимся в технике, в том числе и для создания интеллектуальных систем. 
Однако узкая область применения, недостаточная гибкость, высокая стоимость раз- 
работки и сложности эксплуатации, связанные с нестандартностью таких устройств, 
существенно затрудняют их массовое использование. 

В последние годы набирают популярность унифицированные вычислители (УВ), 
рассчитанные на решение относительно широкого круга задач и лишенные перечис- 
ленных выше недостатков узкоспециализированных устройств. Анализ имеющихся 
сведений позволяет выделить три наиболее перспективных направления в данной 
области в зависимости от типа УВ. 
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Блоки ускоренных вычислений АРО 


Первое направление базируется на применении единого изделия (в идеальном 
случае — в виде СБИС), которое содержит в себе несколько различных вычисли- 
тельных архитектур, оптимизированных под ряд наиболее распространенных задач. 
Предполагается, что такой набор с большой степенью вероятности будет эффективен 
для большого числа вычислительных алгоритмов. Избыточность и простои незадейст- 
вованных ресурсов предполагается компенсировать низкой стоимостью таких изделий, 
их широкой распространенностью и стандартизацией программного обеспечения. 

Типичными представителями данного подхода являются так называемые блоки 
ускоренных вычислений АРЦ (Асс@егае4а Ргосеззте Чпй$). Примером их практической 
реализации могут служить математические акселераторы семейства С$Х600 Адуапсе 
Воага фирмы СеагЗрееа Тесппо]озу. Такого рода устройства широко обсуждались 
несколько лет назад, в настоящее время интерес к ним несколько снизился. 

Основным недостатком унифицированных вычислителей класса АРИ является 
относительно невысокая гибкость и высокая стоимость. Этот подход, к сожалению, 
не дает принципиального разрешения противоречия между высоким быстродействием 
и универсальностью. Вопросы стандартизации и доступности массовому пользова- 
телю также остаются открытыми. Как следствие, интерес к подобным разработкам в 
последнее время заметно снизился. 


Графические процессорные устройства ОРОРУ 


Второе направление ориентировано на нестандартное использование в качестве 
математического ускорителя широкого применения какого-либо существующего 
компонента вычислительной системы. Главная ставка в этом случае делается на 
дешевизну и распространенность задействованного компонента, что существенно 
снижает стоимость владения техническим решением в целом. Классическим примером 
такого подхода является проведение ресурсоемких расчетов на обычных видеокар- 
тах ПЭВМ. 

В настоящее время в вычислительном мире наблюдается настоящий бум, 
связанный с использованием для ресурсоемких вычислений графических адаптеров 
персональных компьютеров. Данное движение называют СРОРО (Сепега1-Ригрозе 
СотриаНоп оп Отаршс$ Ргосеззте Опй$) или ГПУ (графические процессорные 
устройства). Создаются стандарты, разрабатывается системное и прикладное програм- 
мное обеспечение, исследуются вопросы распараллеливания вычислительных методов 
и алгоритмов. Производители аппаратуры начинают выпуск изделий, изначально 
ориентированных на поддержку технологии ОРОРИ. Примером такого устройства 
может служить анонсированный в 2008 году потоковый процессор ЕпеЗгеат 9250 
фирмы АМЮ, содержащий 1 Гб оперативной памяти, пиковая производительность кото- 
рого заявляется равной 1 Тфлопс при одинарной точности вычислений. Номинальная 
потребляемая мощность изделия не более 150 Вт. 

К сожалению, УВ второго класса, в частности, СРОРИ также свойственны не- 
достатки, присущие всем вычислительным устройствам с жесткой архитектурой. 
Фиксированный набор инструкций, однозначно заданная связь между процессорными 
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элементами ограничивают гибкость и область возможного применения. Высокое энер- 
гопотребление и тепловыделение уже сейчас является серьезной проблемой, которая 
будет лишь усугубляться по мере дальнейшего наращивания производительности 
устройств СОРОРЦ, затрудняя их интеграцию в системный блок универсального компью- 
тера, тем более — ноутбука. Тем не менее, широкое распространение используемых 
компонентов и относительно хорошая проработанность вопросов стандартизации де- 
лают данный подход наиболее перспективным на ближайшие несколько лет. Главным 
же положительным эффектом от применения ГПУ представляются такие явления, 
как привлечение внимания большого числа разработчиков и пользователей к воп- 
росам применения унифицированных вычислителей, постановка и решение многих 
вопросов по стандартизации и унификации и ряд других полезных фактов и тенденций. 


РУВ на базе ПЛИС 


Третье направление предполагает использование построенных на базе програм- 
мируемых логических интегральных схем (ПЛИС) со статической памятью реконфи- 
гурируемых унифицированных вычислителей (РУВ), аналогом которых с определенными 
оговорками можно считать КА (Кесопйигае Ассеега{огз) на базе ЕРСА. 

Реконфигурируемые вычислители позволяют задействовать мощный потенциал 
программируемой логики. Современные ПЛИС содержат миллионы эквивалентных 
логических элементов и позволяют синтезировать в себе произвольную цифровую 
вычислительную структуру, способную функционировать на частотах в сотни и ты- 
сячи мегагерц [2], [3]. При таком подходе, теоретически, имеется возможность создавать 
вычислительное средство, идеально подходящее для каждой решаемой задачи. 

В работе [4] обоснованы структура и состав реконфигурируемых унифицированных 
вычислителей. В настоящее время различными фирмами-производителями выпуска- 
ется большое число изделий, которые могут быть использованы в качестве РУВ [5], 
например, реконфигурируемые ускорители ВСНТХ фирмы Сеюожса, ВепОМЕ-Р(Це 
фирмы МаПаесВ и АОРе-ХВКС-4 фирмы Ава Ба. 

Применительно к интеллектуальным системам особый интерес представляют 
реконфигурируемые вычислители для переносных компьютеров. В качестве примера 
такого изделия можно назвать, например, ЕхргеззСаг4-карточку расширения Р1СО Е-16 
производства фирмы Р1со Сотрийп?. Данное устройство включает в себя ПЛИС 
Ущех-5 [Х50 фирмы ХПАМХ, сверхоперативное ЗУ емкостью 32 Мб, контроллер 
шины РСТ Ехргезз, 18 одинарных либо 9 дифференциальных высокоскоростных 
каналов передачи данных. Потребляемая мощность изделия не более 3,45 Вт. 

Унифицированные вычислители данного класса позволяют в значительной 
степени избавиться от недостатков упомянутых выше двух направлений. Главным 
сдерживающим фактором в распространении реконфигурируемых унифицированных 
вычислителей на базе программируемой логики следует признать необходимость 
трудоемкой процедуры создания загружаемых в ПЛИС конфигураций. Успешное реше- 
ние этой проблемы, а также ряда вопросов по стандартизации конструктива и програм- 
много обеспечения различных уровней, позволят перейти к массовому производству и 
применению РУВ, что обеспечивает стабильно высокий интерес к данному направ- 
лению как одному из самых перспективных. 
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Интерфейсы обмена данными с УВ 


В настоящей работе рассмотрены также вопросы взаимодействия УВ и тради- 
ционных процессоров. В табл. 1 приведены различные варианты обмена информацией 
между унифицированными вычислителями и остальными компонентами компьютера. 


Таблица 1 — Интерфейсы обмена данными с УВ 


№ Вариант обмена — о 

1 | Как с периферийным устройством по шине ОВ 60 

2 | Как с накопителем данных по Зета! АТА до 75 

3 | По системной шине РСТ / РС1-Х / РСТ Ехргезз 132 / 528 / 800 
4 | По шине доступа к памяти ООК-П РС2-6400 6400 

5 | По шине НурегТгапзро!" 2.0 41600 


Каждый из вариантов обладает своими преимуществами и недостатками. Вариан- 
ты расположены в порядке увеличения скорости обмена и соответственно стоимости 
решения. Рассмотрим их подробнее. 

Интерфейсная периферийная шина ОЗВ позволяет задействовать большое чис- 
ло УВ, удобно в подключении к ПЭВМ (в том числе -— в режиме «на лету»), дает 
возможность построения высокопроизводительной системы на базе мобильных ком- 
пьютеров. К сожалению, данный вариант является самым медленным из рассматри- 
ваемых решений. 

Подключение УВ подобно накопителям данных, в частности, через интерфейс 
Зепа| АТА, также не очень эффективно по быстродействию. 

Использование для обмена с РУВ системных шин в большинстве случаев яв- 
ляется оптимальным по соотношению производительность/стоимость решения. Число 
используемых вычислителей может быть достаточным для построения относительно 
больших реконфигурируемых систем. Этот вариант также является одним из самых 
надежных в плане защиты от морального старения, поскольку стандарты системных 
шин в современных универсальных ЭВМ являются одними из самых консервативных. 

Вариант применения РУВ, конструктивно выполненных в виде модуля памяти 
на первый взгляд представляется привлекательным из-за высокого быстродействия. 
Однако ему свойственны существенные недостатки. Прежде всего, это небольшое коли- 
чество свободных слотов, которые необходимо делить с модулями памяти. Кроме 
того, на размеры РУВ в этом варианте накладываются существенные ограничения. 

Самым новым вариантом среди упомянутых является решение, основанное на 
технологии НурегТгапзро!е. По этой причине трудно провести объективную оценку 
данного варианта. Шина передачи данных НурегТгапзрой изначально разрабатыва- 
лась для связи между собой процессоров, устройств памяти и реконфигурируемых 
вычислителей [6]. Из известных на сегодняшний день преимуществ можно назвать 
высокое быстродействие, а также возможность реализации УВ в конструктиве, ана- 
логичном центральному процессору, то есть в виде модуля, вставляемого в процессорный 
сокет на материнской плате, изготовленной, например, в двухпроцессорном варианте. 
Примечательно, что в этом случае охлаждение вычислителя может осуществляться 
стандартным кулером, ориентированным на применение с ЦП. Очевидными недостат- 
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ками решения являются высокая стоимость и ограничение по числу одновременно 
подключенных УВ. Негативным также следует признать тот факт, что данная техноло- 
гия в настоящее время не поддерживается основным производителем микропроцессоров 
и наборов системной логики для персональных ЭВМ - фирмой Шше|. Впрочем, дан- 
ная компания также ведет работы в данном направлении. 

Резюмируя вышесказанное, можно сделать вывод о том, что при отсутствии специ- 
фических требований оптимальным решением по соотношению «цена/производитель- 
ность» на сегодняшний день следует считать обмен по системной шине РС! / РС-Х / 
РСГЕхргез$. 


Выводы 


В настоящей работе проанализированы существующие на сегодняшний день 
унифицированные вычислители, способные существенно ускорить решение интел- 
лектуальных задач на стандартных ПЭВМ и ноутбуках. Выделено три направления, 
представляющих наибольший интерес для этих целей, проведено предварительное 
сравнение, рассмотрены преимущества и недостатки каждого из исследованных 
подходов. Наиболее перспективным для решения задач искусственного интеллекта 
представляется направление, ориентированное на применение РУВ. Рассмотрены 
также вопросы взаимодействия УВ с остальными компонентами универсальных 
компьютеров. 
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